Une méthode de classification supervisée sans paramètre pour l'apprentissage sur les grandes bases de données

نویسنده

  • Marc Boullé
چکیده

Résumé. Dans ce papier, nous présentons une méthode de classification supervisée sans paramètre permettant d’attaquer les grandes volumétries. La méthode est basée sur des estimateurs de densités univariés optimaux au sens de Bayes, sur un classifieur Bayesien naïf amélioré par une sélection de variables et un moyennage de modèles exploitant un lissage logarithmique de la distribution a posteriori des modèles. Nous analysons en particulier la complexité algorithmique de la méthode et montrons comment elle permet d’analyser des bases de données nettement plus volumineuses que la mémoire vive disponible. Nous présentons enfin les résultats obtenu lors du récent PASCAL Large Scale Learning Challenge, où notre méthode a obtenu des performances prédictives de premier plan avec des temps de calcul raisonnables.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Détection non supervisée d'une sous-population par méthode d'ensemble et changement de représentation itératif

Résumé. L’apprentissage non supervisé a classiquement pour objectif la détection de sous-populations homogènes (classes) sans information a priori sur celles-ci. Les classes sont considérées de manière équivalente. Le problème étudié dans cet article est quelque peu distinct. On s’intéresse uniquement à une sous-population d’intérêt dans l’échantillon étudié que l’on cherche à identifier avec u...

متن کامل

Une approche de classification non supervisée basée sur la détection de singularités et la corrélation de séries temporelles pour la recherche d'états : application à un bioprocédé fed-batch

Résumé. Nous proposons dans cet article une méthode de clustering qui combine l’analyse dynamique et l’analyse statistique pour caractériser des états. Il s’agit d’une méthode de fouille de données qui travaille sur des ensembles de séries temporelles pour détecter des états; ces états représentent les informations les plus significatives du système. L’objectif de cette méthode non supervisée e...

متن کامل

Une nouvelle méthode divisive de classification non supervisée pour des données symboliques intervalles

Résumé. Dans cet article nous présentons une nouvelle méthode de classification non supervisée pour des données symboliques intervalles. Il s’agit de l’extension d’une méthode de classification non supervisée classique à des données intervalles. La méthode classique suppose que les points observés sont la réalisation d’un processus de Poisson homogène dans k domaines convexes disjoints de R. La...

متن کامل

Une nouvelle approche pour la classification non supervisée en segmentation d'image

Résumé. La segmentation des images en régions est un problème crucial pour l’analyse et la compréhension des images. Parmi les approches existantes pour résoudre ce problème, la classification non supervisée est fréquemment employée lors d’une première étape pour réaliser un partitionnement de l’espace des intensités des pixels (qu’il s’agisse de niveaux de gris, de couleurs ou de réponses spec...

متن کامل

Combinaison de classification supervisée, non-supervisée par la théorie des fonctions de croyance

Résumé. Nous proposons dans cet article une nouvelle approche de classification fondée sur la théorie des fonctions de croyance. Cette méthode repose sur la fusion entre la classification supervisée et la classification non supervisée. En effet, nous sommes face à un problème de manque de données d’apprentissage pour des applications dont les résultats de classification supervisée et non superv...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2009